BDD1 : modèle relationnel, clé,schéma relationnel

MonLycéeNumérique1

Contributeurs MLN

Présentation

Le développement des traitements informatiques nécessite la manipulation de données de plus en plus nombreuses. Leur organisation et leur stockage constituent un enjeu essentiel de performance. Le recours aux bases de données relationnelles est aujourd’hui une solution très répandue. Ces bases de données permettent d’organiser, de stocker, de mettre à jour et d’interroger des données structurées volumineuses utilisées simultanément par différents programmes ou différents utilisateurs. Cela est impossible avec les représentations tabulaires étudiées en classe de première. Des systèmes de gestion de bases de données (SGBD) de très grande taille (de l’ordre du pétaoctet) sont au centre de nombreux dispositifs de collecte, de stockage et de production d’informations. L’accès aux données d’une base de données relationnelle s’effectue grâce à des requêtes d’interrogation et de mise à jour qui peuvent par exemple être rédigées dans le langage SQL (Structured Query Language). Les traitements peuvent conjuguer le recours au langage SQL et à un langage de programmation. Il convient de sensibiliser les élèves à un usage critique et responsable des données.

Les chapitres qui peuvent être mis en relation avec ce chapitre sont :

Aspect historique

Edgar F. Codd (1970) écrit les fondements des bases de données relationnelles.

Le père des bases de données relationnelles est Edgar Frank Codd. Chercheur chez IBM à la fin des années 1960, il étudiait alors de nouvelles méthodes pour gérer de grandes quantités de données, car les modèles et les logiciels de l’époque ne le satisfaisaient pas. Mathématicien de formation, il était persuadé qu’il pourrait utiliser des branches spécifiques des mathématiques (la théorie des ensembles et la logique des prédicats du premier ordre) pour résoudre des difficultés telles que la redondance des données, l’intégrité des données ou l’indépendance de la structure de la base de données avec sa mise en œuvre physique.
En 1970, il publia un article où il proposait de stocker des données hétérogènes dans des tables, permettant d’établir des relations entre elles. De nos jours, ce modèle est extrêmement répandu, mais en 1970, cette idée était considérée comme une curiosité intellectuelle. On doutait que les tables puissent être jamais gérées de manière efficace par un ordinateur.

Ce scepticisme n’a cependant pas empêché Codd de poursuivre ses recherches. Un premier prototype de Système de gestion de bases de données relationnelles (SGBDR) a été construit dans les laboratoires d’IBM.

Depuis les années 80, cette technologie a mûri et a été adoptée par l’industrie. En 1987, le langage SQL, qui étend l’algèbre relationnelle, a été standardisé. C’est dans ce type de modèle que se situe ce cours de base de données. En savoir plus

Quelques définitions

De nombreuses activités ont besoin de stocker des informations. Vous avez de nombreux exemples autour de vous : le lycée et son ENT, les clubs, les jeux en ligne que vous utilisez, etc. Les informations doivent être disponibles pour certains, protégées, modifiables, indépendantes d’un point de vue matériel et logiciel, etc.

Une base de données stocke des informations en rapport avec une activité.

Ces informations peuvent être de natures très hétérogènes.

Les informations sont structurées et cette structure permet d’insérer, de supprimer, de mettre à jour et d’interroger les informations contenues.

Un SGBD (système de gestion de base de données) est une interface entre l’utilisateur et les données.

Voici deux exemples de SGBG : MySql et Oracle.

Conception d’une base de données relationnelle

Exemples de situations nécessitant des bases de données

Imaginez les situations développées dans les exemples ci-dessous :

Vous organisez un tournoi avec des joueurs. Les joueurs s’affrontent dans des duels. Vous voulez avoir des informations sur les joueurs, récupérer les scores, connaître les vainqueurs, etc.

Vous êtes cinéphile et vous voulez vous construire une base de données contenant des informations sur vos films préférés : année de sortie, titre, genre, nom du réalisateur, etc.

Vous voulez également associer à cette base des informations sur les acteurs principaux.

Vous êtes passionné de séries et vous voulez construire une base de données qui contient des informations sur les hébergeurs, les séries, les acteurs et vos notations.

Imaginons le problème suivant : nous voulons construire une base de données contenant les élèves de seconde, première et de terminale pour les matières suivantes : physique, chimie, NSI, SNT, enseignement scientifique et mathématiques. Les élèves viennent de plusieurs lycées de l’académie. On veut stocker dans notre base de données des questions et/ou QCM.

On peut dans ce problème, s’intéresser à la phrase suivante : Galème GANBLAIN, élève de terminale F au lycée Saint-Exupéry, a passé le QCM intitulé “piles_files” dont les résultats sont stockés dans le fichier appelé resultat\_GANBLAIN.csv

Cette phrase contient des informations qu’il va falloir structurer dans une base de données.

Pour concevoir une telle base de données, il va falloir respecter une démarche en étapes afin de définir les objets qui composent notre base de données ainsi que les relations entre ces objets.

La première approche de ces différents exemples serait une approche ‘tableur’. Vous pouvez relire au passage le chapitre de première sur les tables : accès direct au chapitre table de première.

L’approche tableur pourrait être efficace sur un faible nombre de données mais notre base d’informations deviendrait vite instable ;

La modélisation de ces différents exemples se réalise en trois étapes principales qui correspondent à trois niveaux d’abstraction :

  • Niveau conceptuel : description du projet en termes d’objets. Cette description est indépendante de tout support informatique. On parle de modèle entité-association. Les entités sont les objets de notre projet.
  • Niveau logique : description des liens logiques entre les objets du projet. On parle dans ce cas de modèle relationnel.
  • Niveau physique : implémentation informatique sur un SGBD.

Quelques éléments d’analyse de l’exemple traitant du QCM

Dans la phase de conception nous pouvons réaliser un tableau qui recense les données issues de notre analyse. Ce tableau correspond à l’analyse du côté matière.

Concept/objet Code/attribut Description type Taille/domaine Commentaire
Matière idMatiere Identifiant de la matière Entier La matière sera identifiée de manière unique par un nombre. Ce nombre sera appelé clé primaire.
Matière nomMatiere Nom de la matière Texte 30 caractères Physique, chimie, SNT, NSI, mathématiques, SI et enseignement scientifique
Niveau idNiveau Identifiant du niveau Entier Comme pour la matière, le niveau sera identifié par un nombre.
Niveau nomNiveau Nom du Niveau Texte 30 caractères Seconde, première, terminale, BTS_1, BTS 2
Type de la question idTypeQuestion Identifiant du type de question Entier Le type de question sera identifié par un nombre.
Type de la question nomTypeQuestion Nom du type de question Texte 30 caractères QCM, exercice
Thème de la question idTheme Identifiant du thème Entier Le thème sera identifié par un nombre.
Thème de la question nomTheme Nom du thème Texte 30 caractères Structure de données, ihm, algo…
Description du thème de la question desTheme Description du thème Texte Texte qui décrit le thème

Nous cherchons maintenant à décrire une question (exercice et/ou QCM). Pour écrire une question, il faut :

On traitera de manière particulière les champs niveau, matière et thème car ils existent déjà dans notre analyse. Il va falloir les relier à l’objet. Ce lien sera traité par un mécanisme que l’on appellera clé étrangère. Pour renseigner ces champs il suffira d’aller chercher les identifiants correspondants.

Concept/objet Code/attribut Description type Taille/domaine Commentaire
Question idQuestion Identifiant de la Question Entier La Question sera identifiée de manière unique par un nombre. Ce nombre sera appelé clé primaire.
Question idTypeQuestion Identifiant du type de question Entier Ce nombre permet de relier le type de question à la question . Ce nombre sera appelé clé étrangère.
Question idNiveau Identifiant du Niveau Entier Ce nombre permet de relier le niveau à la question . Ce nombre sera appelé clé étrangère.
Question idMatiere Identifiant de la matière Entier Ce nombre permet de relier la matière à la question . Ce nombre sera appelé clé étrangère.
Question idTheme Identifiant du thème Entier Ce nombre permet de relier le thème à la question . Ce nombre sera appelé clé étrangère.
Question Question Question écrite en HTML Texte La question est écrite en langage HTML
Question reponse Réponse écrite en HTML Texte La réponse est écrite en langage HTML
Question solution La solution est une liste ou un tableau de vrai/faux

Voici une représentation sous forme graphique de nos différents objets :

Indiquez sur le diagramme, ci-dessus, par une flèche les différents liens entre ces objets.

Une première analyse

Faire l’analyse d’une base de données dans laquelle vous voulez stocker :

  • Le nom d’une série à regarder.
  • Le réalisateur de cette série (Nom, prénom).
  • La date de sortie de cette série.
  • Le nombre de saisons.
  • L’âge légal à partir duquel on peut visionner la série.
  • La plateforme qui héberge cette série (nom).
  • Un descriptif de la série (texte bref).

Questions :

  1. Quels objets peut-on mettre en évidence pour cette base de données que l’on pourrait appeler series ?

  2. Établir un tableau de vos données.

  3. Représenter vos données à l’aide d’une représentation du type de l’exercice précédent.

  4. Établir les liens entre vos données.

Vous pouvez vous aider de ce type de graphique :

Vous pouvez utiliser l’outil yEd qui possède une version live et une version à installer. Cet outil vous servira pour les graphes et les arbres.

Outil live

Version à télécharger

Entités, attributs et associations

Nous venons de mettre en évidence des objets et des relations entre ces objets. Il y a un certain nombre de notions à définir autour de ce concept de base de données relationnelles. Nous allons définir les notions de :

Une base de données relationnelle est la mise en action de toutes ces notions.

Entité, attribut, domaine

On appelle entité un objet unique qui peut être identifié distinctement par l’ensemble de ces attributs.

Dans la BDD “question”, Matière ou Thème sont des entités.

Dans une BDD “élève du lycée”, l’entité Élève est une entité.

Un attribut est une information élémentaire qui dépend de l’activité modélisée. Un attribut a un nom et une valeur typée.

idMatiere et nomMatiere sont des attributs de l’entité Matière.
La première est de type entier et la seconde de type chaîne de caractères.

Ainsi, l’attribut nomMatiere de type chaîne de caractères.

On appelle domaine d’un attribut l’ensemble des valeurs possibles que peut prendre un attribut.

Par exemple, le domaine de l’attribut nomMatiere est l’ensemble des chaînes de caractères : NSI, Maths, Français, Philo,….

De plus, le domaine de l’attribut idMatiere pourrait être les entiers de 20 à 40, celui de idThème les entiers de 41 à 100.

Autre exemple : le domaine de l’attribut DateNaissance d’un élève doit être l’ensemble des dates comprises entre deux valeurs choisies.

On appelle identifiant ou clé un attribut qui permet d’identifier de manière unique l’entité.

idMatiere est l’attribut correspondant au clé de l’entité Matière.

Autre exemple : idEleve est un nombre entier unique associé à chaque élève.

L’identifiant ou la clé sera appelée clé primaire quand on la considère dans la table qui lui est associée. idMatière est une clé primaire dans la table Matière alors qu’elle devient clé étrangère dans la table Question.

À quel concept (entité ou attribut ou identifiant/clé) pouvez-vous identifier une plaque immatriculation d’un véhicule ?

Une entité est souvent représentée sous la forme :

Nom
identifiant
attribut
attribut

Dans notre projet, on définit une entité Eleve (On prendra comme convention de ne pas utiliser les accents). Cette entité possède plusieurs attributs :

L’entité Eleve sera représentée de la manière suivante :

Une fois qu’une entité est définie, les occurrences de cette entité sont appelées instances ou enregistrements ou tuples ou n-uplets.

Eleve

Une autre instance

Eleve

On représente souvent ces tuples dans un tableau.

IdELeve Nom Prenom

Les attributs sont les noms se trouvant dans l’en-tête, la première ligne d’un tel tableau.
Les tuples ou enregistrements correspondent aux lignes suivantes d’un tel tableau.

Les associations

Une association définit un lien entre deux entités. Une association possède un nom et éventuellement des attributs qui la caractérisent.

On utilise souvent: * Un verbe pour caractériser une association. * Un nom pour parler d’une entité.

Voici une représentation de nos entités et de notre association :

Schémas et modélisations

Il existe de nombreux schémas et différents types de modélisations qui ne sont pas toutes au programme de NSI.

Le modèle entité-association

Ce modèle est hors programme dans le cadre de NSI.

Le modèle relationnel

Une vidéo d’introduction au modèle relationnel

Embedded YouTube video

Dans le modèle relationnel, les entités et les associations sont transformés en tableaux. Ces tableaux sont appelés relations.

On appelle relation un tableau à deux dimensions dans lequel les attributs correspondent aux colonnes et les n-uplets aux lignes.

Dans cet exemple, nous avons accès à une base de données Films qui est composée de plusieurs entités et associations :

Vision synthétique de la base de données :

Voici quelques exemples de relations.

La relation artiste

La relation rôle

La relation film

Dans la relation artiste ci-dessus :

Dans la relation film ci-dessus :

Dans l’association rôle ci-dessus :

Observer dans les trois tables les correspondances entre les identifiants.

Une clé primaire est un ensemble d’attributs dont les valeurs permettent de distinguer les tuples les uns des autres.
Une clé primaire peut être simple ou composée (de plusieurs attributs).

On utilise souvent un nombre entier (avec le préfixe id) pour prendre le rôle de clé primaire.

Dans la relation Eleve, la clé primaire est l’attribut idEleve, attibut qui est bien de type entier.

Dans l’exemple sur la relation artiste :

exercice de renforcement

Une clé étrangère est un attribut qui est la clé primaire d’une autre relation. Elle est indiquée par (FK : “foreign key”) ou précédée d’un #.

Reprenons notre exemple avec la base de données Eleve :

On s’intéresse à l’association scolariser. Cette association a des liens vers :

Les attributs idEle, idLycee sont des clés étrangères dans l’association scolariser.

exercice de renforcement

Un schéma relationnel d’une relation est la donnée pour cette relation :

Un tel schéma relationnel peut être écrit sous la forme d’un tableau ou sous forme textuelle.

On peut transformer une entité en relation donnée par son schéma relationnel.

On peut transformer en relation donnée par son schéma relationnel, l’entitéEleve.

devient :

Eleve

On peut également retrouver une notation textuelle où la clé primaire est soulignée : Eleve(IdEleve, Nom, Prenom)

Dans un schéma relationnel, une clé étrangère est mise en évidence soit avec l’indication FK (pour Foreign Key), soit en étant précédée d’un #.

devient

scolariser

En notation textuelle où les clés étrangères sont précédées d’un symbole # : scolariser(#idLycee, #idEleve, #idNiveau, nomClasse)

Une base de données relationnelle est un ensemble de relations.
L’ensemble des schémas relationnels appelé schéma de la base de données.

exercice de renforcement

Les contraintes d’intégrité

Il existe un certain nombres de règles à respecter pour respecter l’intégrité d’une base de données. Ces règles visent à préserver la cohérence des données et garantir une stabilité de notre base dans le temps.

Il existe des catégories de contraintes d’intégrité à respecter :

Contrainte d’entité

L’existence et l’unicité des clés primaires : une clé primaire ne peut être vide et il ne peut y avoir de doublons dans une relation. Toute relation doit posséder une clé unique que l’on appelle clé primaire. Cela définit la contrainte d’entité (appelée aussi contrainte de relation).

Le problème typique est l’utilisation de l’attribut nomEle dans notre entité Eleve. Cet attribut ne peut définir de manière unique un élève car plusieurs élèves peuvent avoir le même nom. Nous ne pouvons donc pas utiliser cet attribut comme clé primaire. Dans notre exemple nous avons utilisé un attribut idEle. Chaque élève est donc identifié par un numéro unique (unicité); de plus, chaque a nécessairement un tel numéro d’identification (existence).

Contrainte de domaine

Les données que nous souhaitons stocker dans notre base de données ont des formats différents. On parle alors de domaine. On peut s’inspirer des types de données des langages de programmation que nous avons étudiés (integer, booléens, float, char, string).

Les contraintes de domaines doivent permettre de :

Tout attribut d’un n-uplet doit prendre une valeur appartenant à l’ensemble des valeurs possibles prédéfinies pour cet attribut : on parle de contrainte de domaine.

La relation Eleve(IdEleve, Nom, Prenom) a trois attributs :

Ainsi, le n-uplet (3, "Beau", "Gosse") peut être un tuple de la relation Eleve.
Par contre, ("trois", "Go", "Boss") ne peut pas être un tuple de la relation Eleve car “trois” n’est pas un nombre entier.

Contrainte de référence

Nous utilisons les clés primaires afin de distinguer de manière unique nos entités. Ces clés primaires servent également de références dans les autres relations. Il faut veiller à ce que les références soient effectives. On ne peut pas définir une entité qui fait référence par une clé étrangère à une entité qui n’existe pas.

La valeur d’un attribut qui est une clé étrangère doit nécessairement faire référence à un n-uplet existant dans la relation dont cette clé étrangère est la clé primaire : on parle de contrainte de référence.

Reprenons notre relation scolariser : scolariser(#idLycee, #idEleve, #idNiveau, nomClasse)

Dans cette relation : idLycee, idEleve, idNiveau sont des clés étrangères. On ne peut scolariser que des élèves connus dans des lycées connus sur des niveaux connus. Pour ajouter une nouvelle scolarisation d’un élève fictif, il faudra que l’élève soit existant, que son lycée soit existant et que sa classe soit connue. Il sera également impossible de supprimer les entités Lycee ou Eleve

exercice de renforcement

Exercices sur le modèle relationnel

Vous pouvez réfléchir à une base de données qui donnera naissance à un mini-projet.

Exercices de renforcement

clefs primaire et étrangères

Une restauratrice a mis en place un site Web pour gérer ses réservations en ligne. Chaque client peut s’inscrire en saisissant ses identifiants. Une fois connecté, il peut effectuer une réservation en renseignant le jour et l’heure. Il peut également commander son menu en ligne et écrire un avis sur le restaurant.
Le gestionnaire du site Web a créé une base de données associée au site nommée restaurant, contenant les quatre relations du schéma relationnel ci-dessous :

    1. Quelle est la clef primaire de la relation Plat ?

    2. Cette clé primaire est-elle simple ou composée ?

    3. Quel est le domaine de cette clef ?

    1. Quelle est la clef primaire de la relation Commande ?

    2. Cette clé primaire est-elle simple ou composée ?

    1. L’attribut idClient peut-il être la clé primaire de la relation Reservation ? Pourquoi ?

    2. Le couple passwd, nom peut-il être la clé primaire de la relation Client ? Pourquoi ?

Cliquer pour afficher la solution

    1. La clef primaire de la relation Plat est l’attribut souligné idPlat.

    2. Cette clé primaire est simple car elle est constituée d’un seul attribut.

    3. Le domaine de l’attribut idPlat est le type entier.

    1. La clef primaire de la relation Commande est le couple d’attributs soulignés idPlat, idReservation

    2. Cette clé primaire est composée car elle est constituée de plusieurs attributs.

    1. L’attribut idClient ne peut pas être la clé primaire de la relation Reservation car cet attribut n’est pas différent pour chaque réservation : un même client peut effectuer plusieurs réservations.

    2. Le couple passwd, nom ne peut pas être la clé primaire de la relation Client car il ne permet pas d’identifier de manière unique un client. Deux clients différents peuvent porter le même nom et avoir choisi par hasard le même mot de passe, quand bien même la probabilité de cela soit très faible.

Une restauratrice a mis en place un site Web pour gérer ses réservations en ligne. Chaque client peut s’inscrire en saisissant ses identifiants. Une fois connecté, il peut effectuer une réservation en renseignant le jour et l’heure. Il peut également commander son menu en ligne et écrire un avis sur le restaurant.
Le gestionnaire du site Web a créé une base de données associée au site nommée restaurant, contenant les quatre relations du schéma relationnel ci-dessous :

  1. Quelles relations admettent des clefs étrangères ?

  2. Quelle est la clef étrangère de la relation Reservation ?

  3. Vers quelle relation cette étrangère établit-elle une liaison ?

  4. Quel est le domaine de cette clef ?

  5. Combien de clefs étrangères apparaissent dans la relation Commande ?

Cliquer pour afficher la solution

  1. Les relations Reservation et Commande admettent des clefs étrangères, ce sont les attributs matérialisés par le symbole #.

  2. La clef étrangère de la relation Reservation est l’attribut idClient.

  3. La clef étrangère idClient établit une liaison vers la relation Client.

  4. Le domaine de la clef étrangère idClient est une chaîne de caractères (d’après le type VARCHAR).

  5. Deux clefs étrangères apparaissent dans la relation Commande : idPlat et idReservation.

Schéma relationnel

Vous créez un jeu vidéo en ligne. Vous voulez gérer les comptes des joueurs avec une base de données.
Cette base de données contient plusieurs entités :

Établir le schéma relationnel de cette base de données en précisant le type (INT, STRING ou BOOLEAN) de chaque attribut.

Cliquer pour afficher la solution

Voici le schéma relationnel de la base de données :

Contraintes d’intégrité

Vous avez créé un jeu en ligne et vous gérez le compte des joueurs inscrits par l’intermédiaire d’une base de données.
Suite à une tentative d’attaque informatique, votre base de données a peut-être été corrompue.

Pour le savoir vous étudiez des extraits des cinq relations définissant votre base de données :

Voici :

Repérez-vous des anomalies dans ces tables ? Si oui, quelles contraintes ne sont pas respectées ?

Cliquer pour afficher la solution

Logiciels pour représenter les relations

Il existe des logiciels pour représenter les relations et les entités et les associations.

“test d’alignement”

Bibliographie et sitographie

Savoir et Savoir faire

http://www.monlyceenumerique.fr/nsi_terminale/bdd/bdd1.php